首页
下载应用
提交文章
关于我们
🔥 热搜 🔥
1
上海
2
习近平
3
新疆
4
鄂州父女瓜
5
乌鲁木齐
6
疫情
7
H工口小学生赛高
8
习明泽
9
芊川一笑图包
10
印尼排华
分类
社会
娱乐
国际
人权
科技
经济
其它
首页
下载应用
提交文章
关于我们
🔥
热搜
🔥
1
百度
2
今日热点
3
微信公众平台
4
贴吧
5
opgg
6
dnf私服
7
百度贴吧
8
知乎
9
dnf公益服
10
百度傻逼
分类
社会
娱乐
国际
人权
科技
经济
其它
”FAN某”的离婚财产分割判决书(全文)
”FAN某”的离婚财产分割判决书(全文)
公益慈善|“翼行天下 一生守护”慈善项目捐赠仪式圆满举行!
何炅突然高调官宣喜讯,网友恭喜:30年了,终于等到这一天!
哈里斯女粉搞4B运动、毒杀丈夫,回旋镖能否让美国“血流成河”
生成图片,分享到微信朋友圈
查看原文
其他
马尔可夫链
数学算法俱乐部
2020-10-12
数学算法俱乐部
日期
:
2020年05月10日
正文共
:4336
字0图
预计阅读时间
:11
分钟
来源:算法与数学之美
马尔可夫链,因安德烈·马尔可夫(A.A.Markov,1856-1922)得名,是数学中具有马尔可夫性质的离散事件随机过程。该过程中,在给定当前知识或信息的情况下,过去(即当前以前的历史状态)对于预测将来(即当前以后的未来状态)是无关的。
1
、原理简介
X1,X2,X3...马尔可夫链(MarkovChain),描述了一种状态序列,其每个状态值取决于前面有限个状态。马尔可夫链是具有马尔可夫性质的随机变量的一个数列。这些变量的范围,即它们所有可能取值的集合,被称为“状态空间”,而Xn的值则是在时间n的状态。如果Xn+1对于过去状态的条件概率分布仅是Xn的一个函数,则
P(Xn+1=x|X1=x1,X2=x2,...,Xn=xn)=P(Xn+1=x|Xn=xn)
这里x为过程中的某个状态。上面这个恒等式可以被看作是马尔可夫性质。
2、理论发展
马尔可夫在1906年首先做出了这类过程。而将此一般化到可数无限状态空间是由柯尔莫果洛夫在1936年给出的。
物理马尔可夫链通常用来建模排队理论和统计学中的建模,还可作为信号模型用于熵编码技术,如算术编码(著名的LZMA数据压缩算法就使用了马尔可夫链与类似于算术编码的区间编码)。马尔可夫链也有众多的生物学应用,特别是人口过程,可以帮助模拟生物人口过程的建模。隐蔽马尔可夫模型还被用于生物信息学,用以编码区域或基因预测。
3、过程
马尔可夫过程的定义:
⑴设{X(t),t∈T}是一个随机过程,如果在{X(t),t∈T}在t0时刻所处的状态为已知时,与它在时刻t>t0之前所处的状态无关,则称具有马尔可夫性。
⑵设{X(t),t∈T}的状态空间为S,如果对于任意的n≧2,任意的t1<t2<...<tn∈T,在条件X(ti)=xi,xi∈S,i=1,2,...,n-1下,X(tn)的条件分布函数恰好等于在条件X(tn-1)=x(n-1)下的条件分布函数,则称{X(t),t∈T}为马尔可夫过程。
马尔可夫过程,能为给定样品文本,生成粗略,但看似真实的文本:他们被用于众多供消遣的“模仿生成器”软件。马尔可夫链还被用于谱曲。
它们是后面进行推导必不可少的条件:
⑴尺度间具有马尔可夫性质
随机场从上到下形成了马尔可夫链,即Xi的分布只依赖于Xi,与其他更粗糙的尺度无关,这是因为Xi已经包含了所有位于其上层的尺度所含有的信息。
⑵随机场像素的条件独立性
若Xi中像素的父节点已知,则Xi中的像素彼此独立。这一性质使我们不必再考虑平面网格中相邻像素之间的关系,而转为研究尺度间相邻像素(即父子节点)间的关系。
⑶设在给定Xn的情况下,Y中的像素彼此独立
⑷可分离性
若给定任一节点Xi,则以其各子节点为根的子树所对应的变量相互独立。
从只有一个节点的根到和图像大小一致的叶子节点,建立了完整的四叉树模型,各层间的马尔可夫链的因果关系使我们可以由非迭代的推导过程快速计算出X的最大后验概率或后验边缘概率。
4、模型
完整的四叉树模型也存在一些问题。
⑴因概率值过小,计算机的精度难以保障而出现下溢,若层次多,这一问题更为突出。虽然可以通过取对数的方法将接近于0的小值转换成大的负值,但若层次过多、概率值过小,该方法也难以奏效,且为了这些转换所采用的技巧又增加了不少计算量。
⑵当图像较大而导致层次较多时,逐层的计算甚为繁琐。下溢现象肯定会出现,存储中间变量也会占用大量空间,在时间空间上都有更多的开销。
⑶分层模型存在块效应,即区域边界可能出现跳跃,因为在该模型中,同一层随机场中相邻的像素不一定有同一个父节点,同一层的相邻像素间又没有交互,从而可能出现边界不连续的现象。
5、MRF
为了解决这些问题,我们提出一种新的分层MRF模型——半树模型,其结构和图15类似,仍然是四叉树,只是层数比完整的四叉树大大减少,相当于将完整的四叉树截为两部分,只取下面的这部分。模型最下层仍和图像大小一致,但最上层则不止一个节点。完整的四叉树模型所具有的性质完全适用于半树模型,不同点仅在于最上层,完整的树模型从上到下构成了完整的因果依赖性,而半树模型的层间因果关系被截断,该层节点的父节点及祖先均被删去,因此该层中的各节点不具有条件独立性,即不满足上述的性质2,因而对这一层转为考虑层内相邻节点间的关系。半树模型和完整的树模型相比,层次减少了许多,这样,层次间的信息传递快了,概率值也不会因为过多层次的逐层计算而小到出现下溢。但第0层带来了新的问题,我们必须得考虑节点间的交互,才能得出正确的推导结果,也正是因为在第0层考虑了相邻节点间的影响,使得该模型的块现象要好于完整的树模型。对于层次数的选取,我们认为不宜多,太多则达不到简化模型的目的,其优势体现不出来,但也不能太少,因为第0层的概率计算仍然要采用非迭代的算法,层数少表明第0层的节点数仍较多,计算费时,所以在实验中将层数取为完整层次数的一半或一半稍少。
半树模型的 MPM 算法图像分割即已知观测图像y,估计X的配置,采用贝叶斯估计器,可由一个优化问题来表示:?x=argmin[EC(x,x)′|Y=y],x其中代价函数C给出了真实配置为x而实际分割结果为x′时的代价。在已知y的情况下,最小化这一代价的期望,从而得到最佳的分割。代价函数取法不同得到了不同的估计器,若C(x,x′)=1?δ(x,x′)(当x=x′时δ(x,x′)=1,否则δ(x,x′)=0)得到的是MAP估计器,它意味着x和x′只要在一个像素处有不同,则代价为1,对误分类的惩罚比较重。而在实际中存在一些误分类是完全允许的。若将半树模型的MPM算法记为HT-MPM,它分为向上算法和向下算法两步,向上算法自下而上根据式⑵、式⑶逐层计算P(yd(s)|xs)和P(xs,xρ(s)|yd(s)),对最下层P(yd(s)|xs)=P(ys|xs).向下算法自上而下根据式⑴逐层计算P(xs|y),对最上层由P(x0|y)采样x0⑴,…,x0(n),
6、详细说明
时间和状态都是离散的马尔可夫过程称为马尔可夫链,简记为Xn=X(n),n=1,2,3,4····。
马尔可夫链是随机变量的一个数列。这些变量的范围,即他们所有可能取值的集合,被称为“状态空间”,而Xn的值则是在时间n的状态。如果Xn+1对于过去状态的条件概率分布仅是Xn的一个函数,则P(Xn+1=x|X0,X1,X2,...Xn)=P(Xn+1=x|Xn)
马尔可夫链与布朗运动以及遍历假说这两个二十世纪初期物理学重要课题是相联系的,但马尔可夫寻求的似乎不仅于数学动机,名义上是对于纵属事件大数法则的扩张。
马尔可夫链是满足下面两个假设的一种随机过程:
1、t+l时刻系统状态的概率分布只与t时刻的状态有关,与t时刻以前的状态无关;
2、从t时刻到t+l时刻的状态转移与t的值无关。一个马尔可夫链模型可表示为=(S,P,Q),其中各元的含义如下:
1)S是系统所有可能的状态所组成的非空的状态集,有时也称之为系统的状态空间,它可以是有限的、可列的集合或任意非空集。本文中假定S是可数集(即有限或可列)。用小写字母i,j(或Si,Sj)等来表示状态。
2)P是系统的状态转移概率矩阵,其中Pij表示系统在时刻t处于状态i,在下一时刻t+l处于状态j的概率,N是系统所有可能的状态的个数。对于任意i∈s,有。
3)Q是系统的初始概率分布,qi是系统在初始时刻处于状态i的概率,满足。
马尔可夫链是由一个条件分布来表示的:P(Xn+1|Xn)
这被称为是随机过程中的“转移概率”。这有时也被称作是“一步转移概率”。二、三,以及更多步的转移概率可以导自一步转移概率和马尔可夫性质:
同样:这些式子可以通过乘以转移概率并求k−1次积分来一般化到任意的将来时间n+k。边际分布P(Xn)是在时间为n时的状态的分布。初始分布为P(X0)。该过程的变化可以用以下的一个时间步幅来描述:
这是Frobenius-Perronequation的一个版本。这时可能存在一个或多个状态分布π满足:其中Y只是为了便于对变量积分的一个名义。这样的分布π被称作是“平稳分布”(StationaryDistribution)或者“稳态分布”(Steady-stateDistribution)。一个平稳分布是一个对应于特征根为1的条件分布函数的特征方程。
平稳分布是否存在,以及如果存在是否唯一,这是由过程的特定性质决定的。“不可约”是指每一个状态都可来自任意的其它状态。当存在至少一个状态经过一个固定的时间段后连续返回,则这个过程被称为是“周期的”。
离散状态空间中的马尔可夫链模型:如果状态空间是有限的,则转移概率分布可以表示为一个具有(i,j)元素的矩阵,称之为“转移矩阵”:Pij=P(Xn+1=i|Xn=j)
对于一个离散状态空间,k步转移概率的积分即为求和,可以对转移矩阵求k次幂来求得。就是说,如果是一步转移矩阵,就是k步转移后的转移矩阵。
平稳分布是一个满足以下方程的向量:在此情况下,稳态分布π*是一个对应于特征根为1的、该转移矩阵的特征向量。如果转移矩阵不可约,并且是非周期的,则收敛到一个每一列都是不同的平稳分布π*,并且,独立于初始分布π。这是由Perron-Frobeniustheorem所指出的。正的转移矩阵(即矩阵的每一个元素都是正的)是不可约和非周期的。矩阵被称为是一个随机矩阵,当且仅当这是某个马尔可夫链中转移概率的矩阵。
注意:在上面的定式化中,元素(i,j)是由j转移到i的概率。有时候一个由元素(i,j)给出的等价的定式化等于由i转移到j的概率。在此情况下,转移矩阵仅是这里所给出的转移矩阵的转置。另外,一个系统的平稳分布是由该转移矩阵的左特征向量给出的,而不是右特征向量。
转移概率独立于过去的特殊况为熟知的Bernoullischeme。仅有两个可能状态的Bernoullischeme被熟知为贝努利过程
7、现实应用
马尔可夫链模型科学中的应用:马尔可夫链通常用来建模排队理论和统计学中的建模,还可作为信号模型用于熵编码技术,如算法编码。马尔可夫链最近的应用是在地理统计学(geostatistics)中。其中,马尔可夫链用在基于观察数据的二到三维离散变量的随机模拟。这一应用类似于“克里金”地理统计学(Kriginggeostatistics),被称为是“马尔可夫链地理统计学”。这一马尔可夫链地理统计学方法仍在发展过程中。
一个现实应用的例子是,马尔可夫链模型用于分析一个人在某一阶段内由一个职位调到另一个职位的可能性,即调动的概率。该模型的一个基本假设就是,过去的内部人事变动的模式和概率与未来的趋势大体相一致。实际上,这种方法是要分析企业内部人力资源的流动趋势和概率,如升迁、转职、调配或离职等方面的情况,以便为内部的人力资源的调配提供依据。 它的基本思想是:通过发现过去组织人事变动的规律,以推测组织在未来人员的供给情况。马尔可夫链模型通常是分几个时期收集数据,然后再得出平均值,用这些数据代表每一种职位中人员变动的频率,就可以推测出人员变动情况。具体做法是:将计划初期每一种工作的人数量与每一种工作的人员变动概率相乘,然后纵向相加,即得到组织内部未来劳动力的净供给量。
— THE END —
☞
代数发展简史
☞
名人论数学——数学的本质
☞
群论的创立:两个少年天才的接力
☞
无穷存在吗?
☞
施一公:没有高考,就没有一批非常优秀的社会精英从农村走出来
☞
知乎热搜可以被人为控制吗?如果可以,怎么操作
您可能也对以下帖子感兴趣
{{{title}}}
文章有问题?点此查看未经处理的缓存